home *** CD-ROM | disk | FTP | other *** search
/ EnigmA Amiga Run 1996 February / EnigmA AMIGA RUN 04 (1996)(G.R. Edizioni)(IT)[!][issue 1996-02][Skylink CD III].iso / earcd / library / spnshccn.lha / spanish_accent / Programmers.readme < prev    next >
Text File  |  1995-10-08  |  4KB  |  99 lines

  1.  
  2.  
  3.  This file contains information included in the guide file in spanish that
  4. is intended to be read by people willing to improve the
  5. translator-narrator-speak system and specially by Francesco Devitt
  6.  
  7. PROBLEMS WITH TRANSLATOR.LIBRARY:
  8.  
  9.  - Español.accent can't stress correctly words with stress on the last
  10. syllabe without a written tilde (´) like "tapiz" that has to be writen
  11. "tapíz" to be correctly spoken.
  12.  
  13.  The translation rules defined by Francesco Devitt for the accent files
  14. doesn't allow Amiga to know when a word without tilde is stressed on the
  15. last syllabe or the syllabe before the last.
  16.  We know it because if it is stressed on the syllabe before the last, it
  17. ends on vowel, n or s.
  18.  the problem is that there is no way to indicate translator library to
  19. find if a word ends on one of this letters.
  20.  
  21.  Anyway the more i think about it, the more i believe there is a way of
  22. doing this using the existing rules but i can't find it :-(
  23.  
  24. - Español.accent can't translate correctly numbers greater than 9999.
  25.  
  26.  The translation rules defined by Francesco Devitt for the accent files
  27. doesn't allow Amiga to translate correctly an undefined sucession of digits.
  28.  Actual implementation uses a different rule for every position of the same
  29. number at the numeric string, e. g.: this are the rules for number 4:
  30.  
  31. [40](dg~) = { cuarenta }                /* forty */
  32. [4](dg)(dg~) = { cuarenta y }           /* forty something */
  33. [4](dg)(dg)(dg~) = {cuatrocientos}      /* four hundred */
  34. [4](dg)(dg)(dg)(dg~) = { cuatromil }    /* four thousands */
  35. [4] = { cuatro }                        /* four */
  36.  
  37.  The third rule says: if you find a 4 followed by 2 more digits and
  38. something that is not a digit, translate it with "cuatrocientos".
  39.  
  40.  Is easy to deduct that for every new digit we want to add to the recognition
  41. ability it will need a new rule for every number, this means  9 more rules
  42. for every power of ten.
  43.  
  44.  If Francesco Devitt changes the rules it would be easy to increase the
  45. ability with only a rule for every power of 1000!
  46.  if we look carefully how are spoken the numbers in spanish (and similarly
  47. in every other language), we notice that they are divided in groups of 3
  48. digits separated by the words "mil", "millones", "mil", "billones", "mil",
  49. "trillones", etc.
  50.  E. g. if we take number 123123 (ciento veintitrés mil ciento veintitrés or
  51. one hundred and twenty three thousands one hundred and twenty three), we can
  52. see that the first 3 digits are spoken like the last 3 with the word "mil" or
  53. "thousands" separating them.
  54.  We could define the same rules currently defined adding that they can be
  55. followed by any amount of 3 digit groups (including no one) and define
  56. other rules for generating the words "mil" (thousands), "millón" (millions),
  57. etc.
  58.  The actual rules allow to define 3 digit groups but they don't allow to
  59. substitute the empty string by a word that is what is needed for the rules
  60. of "mil", "millon", etc.
  61.  
  62. PROBLEMS WITH NARRATOR.DEVICE:
  63.  
  64.  This device has information about every phoneme in the American english so
  65. it can speak it correctly.
  66.  But almost all other existing languages (including non american english)
  67. have phonemes that are not defined in narrator.device.
  68.  
  69.  Nowadays the only solution is to use the american phonemes that best suit
  70. the sound we want to produce, this inevitably makes Amiga speak like a
  71. cowboy in any other language.
  72.  
  73.  The best solution would be if somebody modifies or creates a new
  74. narrator.device that knows about phonemes of several languages.
  75.  Also, translator.library has to be modified to include definitions for the
  76. new phonemes.
  77.  
  78. PROBLEM WITH SPEAK.HANDLER:
  79.  
  80.  There is a problem with SPEAK-HANDLER v37.4. It seems to filter extended
  81. ASCII so words like "cigüeña" (stork in spanish) or "heiß" (hot in german)
  82. are transformed into "cig e a" and "hei " eliminating characters greater than
  83. 127 before sending the string to translator library.
  84.  The best solution woul be if somebody patches or creates a new speak.handler.
  85.  
  86.  If somebody fixes any of this problems, please contact me or update this
  87. AmiNet archive.                                         |
  88.                             |
  89.  Juan Carlos Pérez Walls  <-----------------------------'
  90.  C/ Eliseo López #1-11-A
  91.  38010 Santa Cruz de Tenerife
  92.  Canary Islands, SPAIN
  93.  
  94.  E-mail:
  95.  Sorry, no e-mail, yet...
  96.  
  97.  Telephone:
  98.  SPAIN + 922-64-03-67
  99.